Материалы по тегу: sapphire rapids
18.10.2023 [14:43], Владимир Мироненко
AWS объявила о доступности инстансов Amazon EC2 R7i для нагрузок с интенсивным использованием памятиОблачная платформа AWS объявила о доступности инстансов для требовательных к памяти нагрузок EC2 R7i на базе кастомизированных процессоров Intel Xeon Sapphire Rapids, доступных только в сервисах AWS. По словам компании, эти процессоры обеспечивают самую высокую вычислительную производительность среди сопоставимых процессоров Intel, используемых облачными провайдерами. Инстансы R7i доступны в девяти размерах. Как сообщается, новинки обеспечивают на 15 % лучше соотношение цены и производительности по сравнению с инстансами Amazon EC2 R6i. Инстансы Amazon EC2 R7i сертифицированы SAP и идеально подходят для рабочих нагрузок с интенсивным использованием памяти, таких как высокопроизводительные базы данных (SQL и NoSQL), распределенные кэши в памяти веб-масштаба (Memcached и Redis), базы данных in-memory (SAP HANA), аналитика больших данных в реальном времени (кластеры Apache Hadoop и Spark) и другие корпоративные приложения. ![]() Amazon EC2 R7i доступны в различных конфигурациях c количеством vCPU до 192 и до 1536 ГиБ памяти, что позволяет консолидировать рабочие нагрузки и масштабировать приложения. К каждому инстансу R7i можно подключить до 128 EBS-томов. Также вскоре будут доступны ещё инстансы bare metal двух размеров. ![]() Следует отметить, что инструкции AMX доступны в любых вариантах и конфигурациях новых инстансов, а ускорители Intel QAT, IAA и DSA будут доступны только в bare metal вариантах. Инстансы Amazon EC2 R7i доступны в следующих регионах AWS: US East (Огайо, Северная Вирджиния), US West (Орегон, США), Europe (Испания, Стокгольм и Ирландия).
14.09.2023 [19:06], Владимир Мироненко
Amazon объявила о доступности EC2-инстансов R7iz (Intel) и R7a (AMD) для нагрузок с повышенными требованиями к памятиAmazon объявила о доступности инстансов EC2 R7iz на базе процессоров Intel Xeon Sapphire Rapids с постоянной турбо-частотой всех ядер 3,9 ГГц и EC2 R7a на базе процессоров AMD EPYC Genoa с максимальной частотой 3,7 ГГц. ![]() Изображения: Amazon AWS Оба семейства предназначены для рабочих нагрузок, требующих больше памяти, вертикального масштабирования, а также более высокую производительность и низкую задержку сети и томов EBS. Экземпляры R7iz ориентированы на EDA, СУБД с высокими лицензионными сборами за ядро, системы анализа данных и финансовые расчёты. К каждому R7iz можно подключить до 88 EBS-томов. ![]() Amazon EC2 R7iz включают фирменные ускорители Intel — инструкции AMX доступны для всех размеров инстансов R7iz, а ускорители Intel QAT, IAA и DSA будут доступны на экземплярах r7iz.metal-16xl и r7iz.metal-32xl. Инстансы R7iz уже доступны в регионах US East (Северная Вирджиния, США) и US West (Орегон, США). Bare metal варианты появятся чуть позже. ![]() Скорость подключения инстансов к сети составляет до 50 Гбит/с, а к EBS-томам — до 40 Гбит/с. Лимиты одинаковы для R7iz и R7a, но к AMD-инстансам можно подключить до 128 EBS-томов. R7a построены на базе системы AWS Nitro, используют адаптеры AWS Elastic Fabric Adapter (EFA), поддерживают инструкции AVX-512 VNNI и формат BF16. ![]() Сообщается, что R7a сертифицированы SAP и идеально подходят для высокопроизводительных рабочих нагрузок с интенсивным использованием памяти, таких как базы данных (No)SQL и in-memory, распределённые кеши, аналитика больших данных в реальном времени и системы EDA. Инстансы Amazon EC2 R7a доступны в следующих регионах AWS: US East (Огайо, США), US East (Северная Вирджиния, США), US West (Орегон, США) и EU (Ireland).
01.09.2023 [14:05], Сергей Карасёв
В Лос-Аламосской лаборатории запущен суперкомпьютер Crossroads на базе Intel Xeon Sapphire RapidsЛос-Аламосская национальная лаборатория (LANL) Министерства энергетики США сообщила о запуске суперкомпьютера Crossroads — первого в мире крупного вычислительного комплекса, полагающегося исключительно на процессоры Intel Xeon Sapphire Rapids, в том числе с HBM-памятью. Система будет применяться для решения сложных научных задач, связанных с ядерным арсеналом США. О создании 165-Пфлопс машины впервые было объявлено в конце 2020 года, а первая фаза установки Crossroads была завершена в октябре 2022 года. Тогда говорилось, что по FP64-производительности новый суперкомпьютер превзойдёт существующую систему LANL Trinity в четыре раза. Отличительной чертой машины является то, что она полагается исключительно на CPU Intel. Как теперь сообщается, в июне оставшееся оборудование, включая компоненты системы жидкостного охлаждения, было доставлено в Стратегический вычислительный комплекс (Strategic Computing Complex), где размещены HPC-системы LANL. После этого специалисты HPE произвели монтаж узлов и обеспечили подключение Crossroads к сети лаборатории. В настоящее время проводится первоначальная диагностика систем Crossroads. Суперкомпьютер станет доступен пользователям нынешней осенью. ![]() Источник изображения: LANL Утверждается, что Crossroads обеспечит в четыре–восемь раз более высокую производительность по сравнению с Trinity при решении сложных задач моделирования. Но точные показатели быстродействия пока не раскрываются. Известно, что в состав суперкомпьютера входят узлы с HBM-версией Sapphire Rapids (Intel Max), а также подсистема хранения данных типа All-Flash.
14.08.2023 [21:37], Сергей Карасёв
С СЖО и без: Giga Computing (Gigabyte) выпустила новые серверы на базе Xeon Sapphire Rapids и NVIDIA HGX H100Компания Giga Computing (Gigabyte), серверное подразделение Gigabyte, анонсировала стоечные серверы G363-SR0 и G593-SD2, выполненные в форм-факторе 3U и 5U соответственно. В основу положены процессоры Intel Xeon Sapphire Rapids и платформа NVIDIA HGX H100. Обе новинки допускают установку двух процессоров в исполнении LGA 4677 (Socket E) с показателем TDP до 350 Вт. Диапазон рабочих температур — от 0 до +35 °C. Модель G363-SR0 оснащена системой прямого жидкостного охлаждения (DLC). Доступны 16 слотов для модулей оперативной памяти DDR5-4800 ёмкостью до 256 Гбайт каждый. Могут быть подключены восемь SFF-накопителей NVMe/SATA/SAS с возможностью горячей замены. Поддерживаются массивы SATA RAID 0/1/10/5. В оснащение входят по два сетевых порта 1GbE и 10GbE, выделенный порт управления 1GbE, два порта USB 3.2 Gen1 и интерфейс Mini-DP. За возможности расширения отвечают шесть слотов PCIe 5.0 x16 (два спереди, четыре сзади), коннекторы OCP 3.0 и М.2 (PCIe 4.0 x4). Задействованы четыре ускорителя NVIDIA H100 (SXM5). Установлены три блока питания мощностью 3000 Вт с сертификатом 80 PLUS Titanium. ![]() Источник изображений: Giga Computing Сервер G593-SD2, ориентированный на задачи ИИ и НРС, располагает 32 слотами для модулей DDR5-4800 и восемью ускорителями NVIDIA H100 (SXM5). Спереди есть восемь отсеков для SFF-накопителей NVMe/SATA/SAS. Данная модель использует воздушное охлаждение и шесть блоков питания мощностью 3000 Вт с сертификатом 80 PLUS Titanium. Предусмотрены 12 слотов PCIe 5.0 x16, два сетевых порта 10GbE, выделенный порт управления 1GbE, два порта USB 3.2 Gen1 и интерфейс D-Sub. ![]()
04.08.2023 [17:59], Владимир Мироненко
AWS запустила инстансы EC2 M7i-flex и EC2 M7i с кастомными чипами Intel Xeon Sapphire RapidsAWS объявила о доступности инстансов Amazon EC2 M7i-flex и EC2 M7i на базе кастомизированных процессоров Intel Xeon Sapphire Rapids. Эти процессоры доступны только в сервисах AWS и, по словам Amazon, обеспечивают на 15 % более высокую производительность по сравнению с сопоставимыми процессорами Intel, используемыми другими провайдерами облачных услуг. Инстансы M7i-Flex — более доступный вариант инстансов M7i, который предлагает на 5 % лучшее соотношение цены и производительности и на 5 % меньшую стоимость. Также у M7i-Flex на 19 % лучше соотношение цены и производительности, чем у инстансов M6i прошлого поколения. По умолчанию эти инстансы предлагают 40 % доступной производительности CPU, но вместе с тем в течение 95 % времени работы инстанса всё же доступно использование процессора на полную мощность. ![]() Изображения: Amazon AWS M7i-Flex подходят для приложений, которые не всегда полностью используют все доступные вычислительные ресурсы, например, для большинства рабочих нагрузок общего назначения, таких как веб-серверы и серверы приложений, VDI, пакетная обработка, микросервисы, базы данных и корпоративные приложения. ![]() Обычные инстансы M7i являются отличным выбором для всех рабочих нагрузок общего назначения, особенно для требующих инстансы самых больших размеров или с высокой нагрузкой на CPU: большие серверы приложений и базы данных, игровые серверы, ML-нагрузки и обработка потокового видео. Инстансы M7i обеспечивают на 15 % лучшее соотношение цены и производительности по сравнению с M6i. Кроме того, к ним можно подключить до 128 томов EBS. ![]() Также AWS вскоре запустит инстансы M7i bare metal для рабочих нагрузок с обработкой большого количества транзакций и чувствительных к задержкам. Примечательно, что фирменные ускорители Intel QAT, IAA и DSA будут доступны только в bare metal вариантах M7i, тогда как инструкции AMX доступны в любых вариантах и конфигурациях новых инстансов. Сейчас M7i-flex и M7i доступны в регионах US East (Огайо), US East (Сев. Вирджиния), US West (Орегон) и Europe (Ирландия).
08.07.2023 [23:57], Сергей Карасёв
Intel возобновила поставки процессоров Xeon Sapphire Rapids, устранив баг путём обновления прошивкиКомпания Intel, по сообщению ресурса Tom's Hardware, возобновила отгрузки процессоров Xeon Sapphire Rapids после устранения выявленной ошибки. Клиенты, которые ранее закупили проблемные чипы, могут получить обновление микрокода, в котором баг отсутствует. Об обнаруженной ошибке стало известно в конце июня нынешнего года. Говорилось, что баг может провоцировать внезапную остановку работы системы. На тот момент способов решения проблемы известно не было. Чипы Sapphire Rapids доступны в двух конструктивных вариантах: XCC и MCC. В первом случае применяется сборка из четырёх кристаллов: число вычислительных ядер варьируется от 36 до 60. Вторая модификация имеет монолитную конструкцию с числом ядер до 32. И именно в MCC-изделиях обнаружилась недоработка. Intel заявила о приостановке поставок этих процессоров из соображений предосторожности, но не назвала конкретную дату возобновления отгрузок. Проблему удалось решить путём выпуска новой версии прошивки, так что компании не пришлось инициировать дорогостоящую программу отзыва и замены чипов. «Недавно мы сообщили о проблеме с подмножеством процессоров Intel Xeon со средним числом ядер (SPR-MCC), которая может прерывать работу системы при определённых условиях. Из соображений предосторожности мы временно приостановили поставки этих изделий. Теперь мы уверены, что новая микропрограмма решает проблему. Мы возобновили поставки всех версий SPR-MCC и работаем с клиентами над внедрением исправленной прошивки», — сказали в Intel.
29.06.2023 [22:54], Алексей Степин
Intel похвасталась результатами Habana Gaudi2 и Xeon Sapphire Rapids в ИИ-бенчмарке MLPerf Training 3.0Группа MLCommons, разработчик набора тестов для ИИ-систем MLPerf, опубликовала результаты MLPerf Training v3.0. Среди протестированных устройств есть и ускорители Habana Gaudi2, и процессоры Intel Xeon Sapphire Rapids. В индустрии распространено мнение о том, что генеративный ИИ и большие языковые модели (LLM) создаются практически исключительно на аппаратном обеспечении NVIDIA. Но как показывают опубликованные результаты, в этом секторе Intel готова конкурировать с NVIDIA. Программная экосистема Habana, по словам Intel, достигла необходимой степени зрелости, а решения компании позволяют говорить о конкурентоспособности даже с NVIDIA H100. Производительность и масштабируемость Gaudi2 была протестирована с помощью GPT-3 (целиком LLM обучать в рамках бенчмарка не требуется) — покорить этот рубеж в MLPerf смогли только NVIDIA и Intel. Кластер из 384 ускорителей Gaudi2 смог завершить обучение за 311 минут, а при росте количества ускорителей с 256 до 384 показал 95 % эффективность масштабирования. Также заслуживает упоминания тот факт, что по сравнению с ноябрьскими результатами Gaudi2 демонстрируют 10-% и 4-% прирост производительности в BERT и ResNet соответственно, причём обошлось без специальной отладки и оптимизации. Кластер из 32 процессоров Intel Xeon Sapphire Rapids тоже заработал «из коробки», показав неплохие в своём классе результаты. Так, в «закрытом» дивизионе он смог «справиться» BERT и ResNet-50 за 48 и 88 минут соответственно. Поддержка матричных расширений Intel Advanced Matrix Extensions (AMX) обеспечила солидный прирост производительности.
29.06.2023 [18:46], Алексей Степин
Опубликованы результаты тестов Intel Xeon Max: набортная HBM-память даёт заметное преимущество в ИИ- и HPC-нагрузкахПроцессоры Intel серии Xeon Max отличаются от своих обычных, «не максимальных» собратьев наличием интегрированной памяти HBM2e объёмом 64 Гбайт. Что же это даёт им на практике? Этот вопрос исследовал ресурс Phoronix — им в руки новейшие двухсокетные системы Supermicro Hyper SuperServer SYS-221H-TNR с чипами Xeon Max 9468 и 9480. Напомним, Intel Xeon Max отличается от своих обычных собратьев серии Sapphire Rapids наличием 64 Гбайт HBM2e на борту, причём объём одинаков для всех моделей, хотя количество ядер может варьироваться от 32 до 56. Процессоры Xeon Max были протестированы в трёх режимах: только с памятью HBM (без DDR5), с HBM в качестве кеша для 512 Гбайт DDR5, а также в «плоском» режиме, но без отдачи HBM какому-либо процессу, то есть фактически только с DDR5. Тесты показали, что два первых режима действительно могут обеспечить преимущество в некоторых сценариях нагрузки. Результаты получились вполне закономерными: там, где сравнительно небольшого объёма HBM2e достаточно, режим HBM Only оказывается самым быстрым из-за высокой пропускной способности и отсутствия необходимости как-то синхронизировать работу с DDR5. ![]() Источник: Phoronix Однако режим кеширования тоже обеспечивает выигрыш, хотя в ряде нагрузок, таких как OpenFOAM, он не такой большой. В ИИ-сценариях, в частности, в тестах OpenVINO, разница меньше, а иногда отключение HBM2e и вовсе позволяет добиться чуть лучшей производительности, особенно на системе с Xeon Max 9480, где на каждое ядро приходится меньше памяти. Но в других тестах, таких как PETSc и Stress-NG, использование HBM2e может дать огромный прирост производительности, который глупо было бы игнорировать. В целом, можно уверенно заявлять, что в среднем, прирост производительности при HBM-кешировании составляет 10–11 %, а при отказе от DDR5 к этому значению можно добавить ещё около 8 %. Также очевидно, что потребление системы в таком режиме заметно ниже, поскольку не требуется питание для модулей DDR5. В целом можно говорить о 18–20 % превосходства на широком спектре нагрузок, сообщает Phoronix.
29.06.2023 [17:37], Сергей Карасёв
Intel пришлось приостановить поставки некоторых чипов Xeon Sapphire Rapids из-за багаКорпорация Intel, по сообщению ресурса Tom's Hardware, вынуждена приостановить поставки определённых процессоров Xeon Sapphire Rapids из-за обнаружившейся ошибки. Баг может провоцировать внезапную остановку работы системы. Специалисты Intel уже занимаются решением проблемы. Чипы Xeon Sapphire Rapids существуют в двух конструктивных исполнениях — XCC и MCC. В первом случае применяется сборка из четырёх кристаллов, а количество вычислительных ядер варьируется от 36 до 60. Второй вариант имеет монолитную конструкцию с числом ядер до 32. ![]() Источник изображения: Intel Известно, что ошибка проявляется в отдельных MCC-моделях Sapphire Rapids. Отгрузки этих продуктов, как отмечается, были приостановлены в середине июня. По всей видимости, Intel работает над новой версией прошивки, которая позволит исправить баг. Если решить проблему удастся таким способом, компании не придётся инициировать программу отзыва и тратить значительные средства на обмен дефектных изделий. «Нам стало известно о проблеме с частью процессоров Xeon Sapphire Rapids (MCC) со средним числом ядер, которая может прерывать работу системы при определённых условиях, и мы активно изучаем её. Из соображений предосторожности мы временно приостановили поставки этих чипов», — сообщил представитель Intel. Нужно отметить, что ошибки в процессорах — не редкость. Так, чипы Intel Skylake вышли с 53 известными багами, а шесть месяцев спустя Intel сообщила ещё о 40 ошибках. А недавно стало известно, что процессоры EPYC Rome перестают функционировать через 1044 дня непрерывной работы, но устранять ошибку AMD не планирует.
23.06.2023 [01:42], Владимир Мироненко
Завершён монтаж суперкомпьютера Aurora на базе Intel Max: 2 Эфлопс, более 20 Тбайт HBM2e и 220-Пбайт хранилищеАргоннская национальная лаборатория (ANL) Министерства энергетики США и Intel объявили о завершении установки всех 10 624 блейд-серверов суперкомпьютера Aurora. Система, как сообщается, обеспечит пиковую теоретическую FP64-производительность более 2 Эфлопс, используя массив из десятков тысяч процессоров Intel Xeon Max, а также ускорителей Data Center GPU Max (Ponte Vecchio). Система будет использоваться для самых разных рабочих нагрузок, от моделирования ядерного синтеза до расчётов по аэродинамике и медицинских исследований. Для Intel (в отличие от AMD) это будет первая в истории машина экзафлопсного класса. Ожидается, что Aurora может возглавить ноябрьский рейтинг TOP500. Впрочем, её может опередить El Capitan или неожиданно появившаяся китайская система. Суперкомпьютер Aurora оснащён 21 248 CPU с более чем 1,1 млн ядер и 63 744 ускорителями, которые будут обслуживать рабочие нагрузки в области ИИ и высокопроизводительных вычислений (HPC). Процессоры Aurora имеют 1,36 Пбайт встроенной памяти HBM2E и дополнены 19,9 Пбайт DDR5, ещё 8,16 Пбайт памяти HBM2E входят в состав ускорителей Ponte Vecchio. Машина состоит из 166 стоек (66 «лезвий» в каждой) в восьми рядах. DAOS-хранилище Aurora содержит 1024 All-Flash узла общей ёмкостью 220 Пбайт и пропускной способностью 31 Тбайт/с. На данный момент ANL не сообщила официальные данные об энергопотреблении Aurora и её подсистемы хранения. Aurora создана на базе платформы HPE Cray Shasta с интерконнектом HPE Slingshot. Хотя блейд-серверы Aurora уже установлены, суперкомпьютеру предстоит пройти ряд приёмочных испытаний, что является обычной процедурой для таких систем. А пока он будет использоваться для обучения крупномасштабных научных моделей для генеративного ИИ. |
|